查看原文
其他

小白入门机器学习的不二法则!“机器学习+材料”零基础培训,抓住科研新风口!

诠释干货 2023-04-30
从科学应用的角度,无论材料、化学、生物、物理、医学、工程等领域,但凡涉及到理论,或者在实验上涉及到数据和模型,就有机器学习的用武之地。
时至今日,机器学习在材料、化学、生物、医学等科学技术领域的成就令人瞩目,几乎无人再质疑机器学习对科学领域做出贡献的可能性。好玩的是,当下炙手可热的科技概念——元宇宙,其本质也存在机器学习的影子。在世界各大经济体明确推动AI发展的大趋势下,机器学习应用于科学技术发展的热度将会一直持续下去。
机器学习的使用强烈依赖于代码编写,这常常是化学专业同学们的短板。现有机器学习课程多为计算机方向,无法快速落地到生化环材等学科研究。为了帮助科研人员快速切入新风口,华算科技开设了“机器学习与材料/化学”课程,课程提供无限次回放,建立永不解散的课程群,及时答疑。
课程面向Python零基础,对机器学习感兴趣,想在自己的研究方向使用机器学习的化学、材料学相关工作者。通过本次课程,大家可以学会当下最流行的Python语言,学会抓取数据库,能使用机器学习基本算法,并会用于机器学习解决化学与材料学的实验数据处理、材料筛选与性质预测等问题,能够重现机器学习的文献案例。
许多化合物可以通过实验、理论计算或者机器学习方法进行研究
四个科学范式:经验,理论,计算和数据驱动
被称为“五V”的大数据特征
著名材料科学数据库Materials Project于2022年5月底进行了较大的更新改动,新旧版数据库使用差别较大,本次课程将介绍新版数据库的主要使用与数据抓取办法,确保参与的老师和同学掌握前沿的技术手段。
新版Materials Project界面图
报名即送5000核时计算资源(价值650元)!
前20位报名立减500元,数量有限,先到先得!
👇👇扫描二维码,立即报名👇👇 
👆👆电话:13609617837 👆👆
往期课程学员评价:
(点击图片可查看大图)
01课程背景
课程针对零编程基础的化学、材料学工作者设计,先扎实学习当下最流行、与机器学习契合度最高的Python语言,再学习机器学习的基本算法,并对文献案例进行重现。课程包含大量实际操作内容,掌握编程神器Python与黑科技机器学习不再遥不可及。
02讲师介绍
黄博士:华算科技全职技术专家,武汉大学本科,北京大学博士,新加坡国立大学访问学者。目前已发表SCI文章共20篇,其中第一作者文章5篇,单篇最高影响因子>40。
从事理论计算与实验化学研究工作十年,擅长使用机器学习进行化学理论的研究及实验数据的处理,曾获华中地区数学建模邀请赛三等奖,北京大学游戏AI对抗全国邀请赛第四名等相关奖项。
03课表一览

04课程内容
课前免费提供相关Python软件的安装录像,课前完成软件安装,课上直接使用!整个课程分为8个主要部分,每个部分内容如下:

开始Python学习之旅!

介绍Python的功能与用途,Python近年的发展趋势、流行的原因以及其在科学数据处理、可视化方面的应用。了解Anaconda,学习Jupyter编译环境的基本使用,编写属于自己的第一个Python程序,学会查看Python错误,并根据错误提示修正代码。学会查看帮助文件。


学习Python的基本使用!

了解Python的基本变量、运算符、语法,学会使用Python的条件判断语句、循环语句。完成计算Fibonacci数列程序的编写。了解Python中函数的概念,会编写Python函数,并用于对可逆氢电极电势案例。学会使用Python读写文件。完成此部分的学习后,我们已经可以使用Python编写简单的程序了!


强大的Python库

Python的强大源于它的第三方库,此部分将开始Python库的学习!在此部分,将学会Python库的安装、导入与使用方法。对于众多的Python库,我们着重学习NumPy库、pandas库与matplotlib库,掌握它们的数据类型与使用方法。
结合Python库以及文件读写,我们已经可以编写较为复杂的Python程序,用于进行实验数据或计算文件的后处理了。我们这里将以谱数据平滑为案例,介绍数据处理的流程与实现方式。科学研究上常常将NumPy,SciPy,matplotlib等Python库结合使用,用于替代matlab、origin等商业软件进行数据处理与展示!


迈向机器学习!

掌握了神器Python,我们将开始我们的机器学习之旅。此部分的学习后我们对机器学习的使用有概括性的认识,了解到机器学习在化学中的主要应用领域,并将知晓机器学习在化学、材料科学研究中的优势。在这部分中,我们还会学习使用Python对数据进行可视化,这将对我们数据处理与机器学习的结果处理有很大的帮助。


机器学习算法

此部分将学习机器学习的主要算法。对于回归算法与分类算法,将会对原理进行细致的讲解,并使用多个相关的案例对不同算法进行演示与实际操作:双金属d带中心与吸附能(单变量线性回归)、预测HER活性(多变量线性回归)、连续反应动力学(非线性回归)、有机小分子分类(决策树分类、支持向量机分类)。
在模型未知时,模型的评价显得极为重要,课程中将对留出法、交叉验证法等模型评价方法进行讲解与实际操作,并使用预测HER活性案例进行学习,让大家今后能在研究中会做出正确的模型选择。


万里挑一,机器学习与高通量筛选

高通量筛选是目前在化学中与材料科学中常用的数据利用方法,数据库也逐渐成为机器学习与材料信息学中大量数据的来源,本部分将介绍新版Materials Project的功能与使用,并介绍一些常用的材料科学数据库。
课程还将使用Python中专为材料科学打造的数据挖掘库——matminer。通过matminer,可以轻松的获取大量的催化材料、电极材料数据并进行清洗。我们将节选电极表面涂层材料的高通量筛选作为案例,进行高通量筛选的实际操作练习,部分重复文献中的高通量筛选内容。我们还将学习如何将机器学习与高通量筛选进行结合,使科研更为高效。


机器学习经典案例

经过前面的学习,机器学习在我们面前已不再神秘,我们已经掌握了机器学习的基本算法,并且对部分案例进行了学习。这时,我们可以选择更多相关的案例,做更为全面的解读与重现,检验我们的学习成果!
我们选择了预测d带中心、预测体积模量作为核心案例,通过实际操作,复原整个预测过程。两个案例输入的预处理不同,使用的机器学习模型不同,这使得我们一方面巩固了我们Python与机器学习使用的基础,另一方面使得我们更透彻的了解如何将机器学习应用到实际研究之中。


机器学习的最前沿

到这个阶段我们已经完成了机器学习的入门了,我们知道如何将机器学习应用到本学科的研究当中。但不可否认的是,机器学习仍有很多可学习的地方,很多经典的案例因为种种原因,例如复现所需时间过长,数据集过大或尚未公开,使用较复杂模型(如:神经网络模型,该模型实操部分将于进阶课中进行)等等,并不能大家一起在课堂上完成。
对于这些案例,我们也将精选重要的部分(如当下热门的机器学习原子势,实时从头算分子动力学)进行学习与讲解,并介绍一些机器学习常用软件。使我们知晓机器学习在化学上最前沿的应用。完成了系统的学习,机器学习对我们不再神秘,并将成为我们自己的科研黑科技武器。

05报名方式
主办单位:深圳华算科技有限公司(拥有VASP、Materials Studio、Gaussian、LAMMPS商业版权
培训形式:录播课程,课程群永不解散,随时提问,及时解答。
课程费用:3980元,提供增值税普通发票及邀请函。请提前报名,我们会根据学员课前反馈,适当增加课程内容。老客户有优惠,请联系华算科技-邵丹咨询。报名方式:识别下方二维码报名,或者联系手机136-0961-7837👇👇扫描二维码,立即报名👇👇 👆👆电话:136-0961-7837 👆👆06付款方式1.银行转账汇款
收款单位:深圳华算科技有限公司
银行账号:758869652456开户行:中国银行深圳西丽支行 注意:付款时请备注“姓名+单位+机器学习”2.支付宝转账企业支付宝账户:hskj@v-suan.com请核对户名:深圳华算科技有限公司注意:付款时请备注“姓名+单位+机器学习”3.刷卡/扫码支付可通过公司微信收款码刷公务卡,请扫码填写报名信息以便我们提前为您准备发票等报销手续。

划重点:请先添加课程客服微信报名再缴费!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存